課程資訊
課程名稱
資訊檢索與文字探勘導論
INTRODUCTION TO INFORMATION RETRIEVAL AND TEXT MINING 
開課學期
99-1 
授課對象
管理學院  資訊管理學研究所  
授課教師
陳建錦 
課號
IM5030 
課程識別碼
725EU3410 
班次
 
學分
全/半年
半年 
必/選修
選修 
上課時間
星期三6,7,8(13:20~16:20) 
上課地點
管二302 
備註
本課程以英語授課。本課程以英語授課。
限學士班三年級以上
總人數上限:25人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/991IRTM 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

本課程將介紹資訊檢索與文字探勘的相關技術與演算法,課程內容將包含關鍵字抽取、關鍵字權重計算、向量空間模型、二元獨立模型、語言模型、資訊檢索系統評估方法、貝氏分類器、Rocchio分類器、最近鄰居分類法、k-means分群法,階層式分群法、PageRank演算法與HITS演算法。此外,學生將撰寫許多系統相關程式以了解如何開發一套資訊檢索系統。 

課程目標
本課程的目標在於介紹資訊檢索與文字探勘等相關技術,授課對象為大學部高年級學生與研究所學生。課程的前半部分將介紹基本的資訊檢索技術與方法,而課程的後半部分將觸及一些文字探勘的研究議題(如文件自動分類與分群),本課程將包含這進階與基礎內容以求學生能完整的習得資訊檢索的相關知識。 
課程要求
程式語言、資料結構、機率 
預期每週課後學習時數
 
Office Hours
每週四 11:00~12:00 
指定閱讀
 
參考書目
Christopher D. Manning,
Prabhakar Raghavan, and
Hinrich
Schutze, "Introduction to
Information Retrieval,"
Cambridge University Press.
2008. 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
Term Project 
40% 
 
2. 
程式作業 
30% 
(約4次) 
3. 
期中考 
30% 
 
 
課程進度
週次
日期
單元主題
第1週
9/15  Syllabus <BR>Term Vocabulary 
第2週
9/22  中秋節 
第3週
9/29  The Term Vocabulary<BR>Scoring, Term Weighting and the Vector Space Model 
第4週
10/6  Evaluation in Information Retrieval 
第5週
10/13  Evaluation in Information Retrieval <BR>Relevance Feedback and Query Expansion 
第6週
10/20  Probabilistic Information Retrieval 
第7週
10/27  Probabilistic Information Retrieval <BR>Language Models for Information Retrieval 
第8週
11/3  停課 (參加學術會議) 
第9週
11/10  期中考 
第10週
11/17  Language Models for Information Retrieval<BR>Text Classification and Na簿ve Bayes 
第11週
11/24  Text Classification and Na&#239;ve Bayes 
第12週
12/1  Text Classification and Na簿ve Bayes <BR>Vector Space Classification 
第13週
12/8  Vector Space Classification <BR>Hierarchical Clustering 
第14週
12/15  Hierarchical Clustering 
第15週
12/22  Hierarchical Clustering <BR>
Flat Clustering 
第16週
12/29  Flat Clustering <BR>Topic Detection and Incremental Clustering 
第17週
1/5  Link Analysis 
第18週
1/12  IRTM Workshop